pular para o texto principal

Extraindo Texto de Imagens Digitalizadas (OCR)

Digitalize textos em revistas e jornais e exiba-os no em seu editor de texto.

Nota

  • Você pode extrair texto ao digitalizar via Documento (Document), Personalizar (Custom) ou Driver.
  • As telas para digitalizar documentos são usadas como exemplos nas descrições a seguir.
  1. Inicie o IJ Scan Utility.

  2. Clique em Configs... (Settings...).

    figura: IJ Scan Utility

    A caixa de diálogo Configurações é exibida.

  3. Clique em Digitalização de documento (Document Scan).

    figura: caixa de diálogo Configurações

    Nota

    • Para Resolução (Resolution), somente 300 dpi ou 400 dpi pode ser definido quando Iniciar OCR (Start OCR) é selecionado em Configurações de aplicativo (Application Settings).
  4. Selecione Iniciar OCR (Start OCR) para Configurações de aplicativo (Application Settings) e, em seguida, selecione o aplicativo em que deseja exibir o resultado.

    figura: caixa de diálogo Configurações

    Nota

    • Se um aplicativo compatível não estiver instalado, o texto da imagem será extraído e aparecerá em seu editor de texto. Quando dois ou mais documentos são digitalizados, o texto extraído é exibido em um único arquivo de texto.
      O texto a ser exibido se baseia em Idioma do documento (Document Language) na caixa de diálogo Configurações (Configurações gerais) (Settings (General Settings)). Selecione o idioma que você deseja extrair do Idioma do documento (Document Language) e digitalize.
    • Você pode adicionar o aplicativo do menu pop-up.
  5. Clique em OK.

    figura: caixa de diálogo Configurações

    A tela principal do IJ Scan Utility aparece.

    Nota

  6. Clique em Documento (Document).

    figura: IJ Scan Utility

    A digitalização é iniciada.

    Quando a digitalização for concluída, as imagens digitalizadas serão salvas de acordo com as configurações e o texto extraído aparecerá no aplicativo especificado.

    Nota

    • Para cancelar a digitalização, clique em Cancelar (Cancel).
    • O texto exibido em seu editor de texto é somente para referência. O texto na imagem dos tipos de documentos a seguir talvez não seja detectado corretamente.

      • Documentos que contêm texto com tamanho de fonte fora da faixa de 8 a 40 pontos (a 300 ppp)
      • Documentos inclinados
      • Documentos colocados de cabeça para baixo ou com texto na orientação incorreta (caracteres girados)
      • Documentos com fontes especiais, efeitos, itálico ou texto manuscrito
      • Documentos com espaço estreito entre as linhas
      • Documentos com cores no segundo plano do texto
      • Documentos que contêm vários idiomas